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Работа посвящена построению параллельных алгоритмов управления шагом интегрирования при 
решении задачи Коши для систем обыкновенных дифференциальных уравнений. Алгоритмы строятся 
на многошаговых коллокационных блочных методах со старшими производными, что обеспечивает 
векторизацию процедуры получения решения. Для выравнивания порядка аппроксимации во всех 
расчетных точках блока используются многочлены Эрмита. 
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Робота присвячена побудов! паралельних алгоритм!в управл1ння кроком 1нтегрування при розв’язанн1 
задач1 Кош! для систем звичайних диференщальних ривнянь. Алгоритми будуються на багато- 
крокових колокашЙних блокових методах 31 старшими похдними, що забезпечуе векторизащю 
процедури одержання розв’язку. Для вирвнювання порядку апроксимацй у вс1х розрахункових 
точках блоку використовуються багаточлени Ермйа. 

Ключов: слова: задача Копи, паралельн! обчислення, колокащя, багаточлени Эрмта. 


При численном моделировании сложных динамических объектов, описываемых 
системами обыкновенных дифференциальных уравнений (СОДУ), необходимы вычисли- 
тельные мощности такого порядка, который может быть обеспечен только многопроцес- 
сорными компьютерами [1], [2]. При этом для эффективной параллельной реализации 
требуется построение соответствующих численных методов, поскольку подавляющее 
большинство существующих методов не ориентировано на параллельную архитекту- 
ру [3]. Еще одной проблемой является жесткость СОДУ и необходимость проведения 
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вычислений на очень большом интервале времени. В таких случаях для численного 
интегрирования привлекаются расчетные схемы с хорошими свойствами устойчивости, 
сходимости и со встроенными функциями управления шагом [4]. Данная статья является 
продолжением работ [5-8] и базируется на идее построения коллокационных блочных ме- 
тодов, которые обеспечивают векторизацию процедуры получения решения задачи Коши 
х'= 1(1х(1)), хп) =м1еЕ[ю,Т]. (1) 

Повышение скорости сходимости осуществляется за счет введения вместо интерпо- 
ляционных многочленов Лагранжа многочленов с кратными узлами, для которых требу- 
ется совпадения в точках коллокации /, + не только значений функции Г(1,х(1)), 


но и ее производных Г (у) (1,х(1)), 1 =1,2,..,р, до порядка р, включительно [7]. В качестве 
многочлена с кратными узлами предполагается использование полинома Эрмита, 
который может быть построен в виде рекуррентных соотношений, или получен путем 
предельного перехода из многочленов Лагранжа и Ньютона [9]. 

Для параллельной реализации выбирается блочный метод, тип которого опре- 
деляется количеством используемых опорных точек. Если в расчетной схеме для вычи- 
слений приближенных значений в следующем блоке используется только значение в 
последней точке предшествующего блока, можно говорить об одношаговом коллока- 
ционном блочном методе 

ГКП 
ид ну а ры (2) 
1=1 

где РЁ, г = Г ( и +п,и, ; ) [-я производная правой части, 

а 7 — коэффициенты расчетной схемы, которые находятся из соотношений 
и = | да, Ь1=1,2,..,5 


где й, | — соответствующие многочлены Эрмита. 


При использовании всех или нескольких значений в точках предшествующего 
блока речь будет идти о многошаговом коллокационном блочном методе вида 


т 
Иа + ВЕ + Уна Е, 1=12,.5, п=1,2,..М, (3) 
‚= 1=0 #=1 
где р; - старший порядок введенной производной правой части в точке {/,„ + ]т. 
Модификация разностных схем (3), описанная в [10], связана с введением по- 
вышенного порядка производных в опорных точках, что позволяет повысить порядок 
аппроксимации разностных схем и не приводит к росту размерности системы. Тогда 
модифицированные уравнения многошаговых разностных методов для блока из 5 точек 
при использовании вычисленных значений приближенного решения в 71 предшеству- 
ющих блоку узлах, с учетом ны выше обозначений, можно записать 


и У НИЕИ, ик, 1=1,2,..,5 п=1,2,...М. (4) 
1=11=0 [=0 1=1 


Поскольку все значения правых частей опорного блока г. (0) м: уже известны, можно 


определять их старшие производные и = И, [= 1,2,...,4,,1= 1,2,..,т, не увели- 


чивая количество уравнений в системе. 
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Формулы (4) определяют блочный коллокационный т-шаговый $-точечный 
разностный метод со старшими производными правых частей в расчетных и опорных 


точках блока. При этом 1, ={1,1,,2,..„„‚ } — множество точек, в которых значения 


определяются одновременно. В качестве исходных методов в работе рассматриваются 
вычислительные схемы (2 - 4) для блоков, содержащих $ узлов, при использовании 
вычисленных значений приближенного решения в одном (2) или т (3 -— 4) предшеству- 
ющих блоку узлах. 

Для численного решения задачи (1) одношаговым коллокационным блочным ме- 
тодом (2) с числом расчетных точек 5 выделяются две системы процессорных узлов, 
на которых запускаются параллельные процессы. Первая система узлов обеспечивает 
параллельную реализацию одношагового коллокационного блочного $-точечного метода, 


для чего требуется $ процессоров для получения значений и,„.у,, {= [1,2,...,5. На второй 


системе узлов осуществляется реализация одношагового коллокационного блочного 5+ /- 
точечного метода с получением значений. Размерность вычислительного поля представ- 
ляется двумя вариантами. В первом случае — это две закольцованные линейки, количество 
процессоров в которых совпадает с размерностью блоков 5 и 5+/ соответственно, во вто- 
ром случае — вычислительные поля представляются решетками процессоров. Первая 
решетка с 5 (количество точек в блоке) столбцами и М (количество уравнений в системе) 
строками, у второй решетки размерность процессорного поля. Для осуществления итера- 
ций по (2) в каждом 1-м процессоре, обеспечивающем вычисления $ точечным методом, 


размещаются соответствующие коэффициенты а, и Ь,, 1=1,2,..5+1, 1 =1,2,...5-+1, а также 


значения элементов вектора правых частей системы в последней точке предшествующего 
блока, которые будут считаться начальными для следующего. Для группы процессоров 
элементов, которые обеспечивают решение 5 +1 точечным методом, соответствующие 


коэффициенты а, у, Ь,, 1= 1,2,...,5 +1, ] = [1,2,....5+1. Дополнительно на каждой итерации 


рассчитываются значения производных правых частей Е й = (1) ‚[=1,2,...а,1=1,2,..,5-+1. 


Параллельное управление шагом для задачи (1) многошаговым коллокационным блоч- 
ным методом с производными старших порядков (3) с числом опорных точек 1 и рас- 
четных 5 не будет иметь принципиальных различий с рассмотренными в [11] подходами. 
Однако возникает необходимость в формировании начальных данных для расчета 
очередного блока значений. В зависимости от значения нормы вектора расхождений, 
будет изменяться расчетная схема определения шага интегрирования. Если норма вектора 
расхождений не превосходит заданную глобальную точность вычислений 


ным 5- /-точечным методом И,„1;› 1 =1,2,. 5+1. Рассчитывается новое значение шага Ру 


ИИ 


к <1011= 1,2,...5, за основу берется решение, полученное коллокационным блоч- 


& 4 


и по результатам расчета 5 +/-точечным 7-шаговым мегодом формируется НОВЫЙ 
вектор опорных точек. Если норма вектора расхождений не превосходит заданную ло- 


т, =ттт| ах тах, тах| ахти, © (5) 


[м и 


т 


<=, 1 = [,2,...,5 ‚ за основу берется ре- 


= [,2,...,5., 


кальную точность вычислений, т.е. [0/ < | ии, 


шение, полученное коллокационным блочным 5-точечным методом И’. ,, 


Рассчитывается новое значение шага 7„„„, и новый вектор опорных точек формируется 


490 «Искусственный интеллект» 2013 №3 


Параллельный контроль размера шага... в) 


по результатам расчета 5-точечным методом. Если полученное решение не обеспечи- 
вает заданную локальную точность, от шага необходимо отказаться, сократив его на 
величину, задаваемую параметром /ахт!и. В качестве максимальных коэффициентов 
увеличения шага /астах и уменьшения /ахтт, параметра @ ‚ а также начальной длины 
шага могут быть приняты значения, описанные в [5]. 

Для выявления рабочих характеристик и областей применимости, разработанных 
коллокационных методов со старшими производными, рассматривалась численная 
реализация известных тестовых задач: жестких, плохо обусловленных, быстроосцил- 
лирующих, жесткоосциллирующих и т.п. Одним из таких тестов является система 
обыкновенных дифференциальных уравнений вида 


хр’ = Мох, хз’ = (Мо - и, )х, + (Ш чу, )х2 — У, хз, (6) 
хз’ = (№ — М: -и,)х, + 2и1х› + (№ —2и,) хз, 
х4'= (№ — М1 и; )х! + 2и1х) + (д, и! - 2) хз + (ш› +у>)х, —и2х,, 
х;' = (40 - м! 2, )х, + 2у,х) + (м У - А? и› хз + 2и›х\ + (> 2 )х,, 
приведенная в [12]. 


х1, Х2, ХЗ, х4, х5 Етог Х1, Х2, ХЗ, х4, х5 

2.5 8 
2.01 6 
1.5 

4. 
1.0 
0.5 | 2. 

| 1 


Рисунок 1 — Поведение численного решения а) и распределения глобальных 
погрешностей 6) задачи (6 — 8) 


Если выполнены условия х›(0)=х.(0), х.(0)=х;(0), то точное решение этой 


системы на интервале { Е [0,1 ] имеет вид 
х‚(1) = х(0)ем#, х,(1) = х (1) + (х2(0)- х,(0))е*" соз(уи ), 
х(1) = х,(#)+ У2 (х›(0)-х/(0))е“" зт(у,(1+л/4)), 
х;(1)= хз (1)+(х4(0)-х2(0))е“? со$(у21), 
х5() = х;(1)+ 2 (х4(0)-х›(0))е“?' т(у›(1+л/4)). 


Задача (5) может быть хорошо обусловленной и нежесткой при начальных условиях 


х(0)=1,х›(0)=х.(0)= 1.5, х.(0)=х,(0) = 2.5 (7) 
и со следующими значениями параметров 
Шо =-2, М = 1, и? = Ту, =-Ьу) = 10. (8) 


Даже для нежесткого варианта задачи (6) с начальными условиями (7) и с 
параметрами (8) при численном решении коллокационными методами с заданной 
точностью имеет место преимущество по времени получения решения. Это 
объясняется тем, что число просчетов сокращается пропорционально размерности 
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блока. На рис. | показано поведение численного решения и распределения глобальных 


погрешностей при заданной точности /0`°. Задача (6) плохо обусловлена (рис.2) при на- 
чальных условиях [12] 


х1, х2, х3, х4, х5 Етог х1, х2, хз, х4, х5 
вою 6 
2000 


5. [110 
1500 
1000 


500 5. [110 


1. 010 


0.0 0.2 0.4 


а) 


Рисунок 2 — Поведение численного решения а) и распределения глобальных 
погрешностей 6) задачи (6, 9 — 10) 


0.6 0.8 1.0 


х(0)=0.1,х›(0)=ж(0)=Ьх,(0)=ж(0)= 0.5 (9) 
с параметрами 
9 =-2, ш = = Ти =-Ьи, = 10. (10) 
Еггог И 


1. 010 


Рисунок 3 — Поведение численного решения а) и распределения глобальных 
погрешностей 6) задачи (6, 11 — 12) 
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Рисунок 5 — Вариация шага для 
задачи (6, 9 —10) 
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Рисунок 4 — Вариация шага для 
задачи (6 — 8) 
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Рисунок 6 — Вариация шага для 
задачи (6, 11-12) 


492 


«Искусственный интеллект» 


Рисунок 7 — Вариация шага для 
задачи (6, 13 — 14) 


2013 №3 


Параллельный контроль размера шага... в) 


Задача (6) быстроосциллирующая при начальных условиях [12] 


х(0)= 0.5, х›(0)=х;(0)= 0.8, х/(0)=х;(0)=2 (11) 
с параметрами 
№ =-2, Ш = 1, и = Би, = Ки, = 1000. (12) 


Поведение численного решения и распределения глобальных погрешностей для за- 


дачи (6, 11 — 12) при заданной точности / 0`° показано на рис. 3. Задача (6), жесткая 
при начальных условиях 

х,(0) = 10, х›(0)=х:(0)=11,х.(0)=х;(0)=111 (13) 
с параметрами 

у =-100, м =-1, и› =Т и, = -10000, и, = 10. (14) 

Вариация длины шага по каждому из рассмотренных вариантов приведена на рис. 4—7. 
Построение процедуры управления шагом на коллокационных блочных методах 

со старшими производными позволяет продвигаться сразу на 5 или на 5+1 расчетную 
точку в зависимости от нормированных величин расхождений, полученных при форми- 
ровании очередного блока, что обеспечивает соответствующую величину ускорения 
даже при последовательной реализации. Введение дополнительных производных позво- 
лило значительно повысить порядок аппроксимации, не прибегая к наращиванию размер- 
ности системы, как это происходит при использовании многостадийных методов. На 
известных тестовых задачах выполнена параллельная реализация всех предложенных 
в разделе алгоритмов управления шагом. В качестве размера шага выбирался максималь- 
но возможный, обеспечивающий с учетом гарантийных факторов локальную точность. 
Полученные характеристики параллелизма свидетельствуют о высоких скоростных 
свойствах разработанных методов. 
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ВЕЗОМЕ 
О.А. Отитеуа 


РагаИе У ер Сотто[ оп Ше Ва515 о} СоПосапоп Метфо45 ий ибе 
о [тегроайоп Ро[’пот5 ор Негтйе 


ТБе рарег сопсегпз$ Изе! оЁ рагаПе| зер сопёо|! ул фе питепса| геаП7айоп оЁ Фе 
Саисрву ргоМега ог ог4тагу Аегепна! едианбоп$ ап Феш зуетз ш рагаЦе сотаршщег 
зузетз. Тре Моск соПосайоп тейо4$ аге 4еуеоре Фа аПо\у из ю Вп4 а зовоп 
зипиНапеоцзу ш а Фе сасиайпе роз ор Фе ЫоскК, УЛмсь гедисез ве ите оРоМашше Фе 
зоибоп еуеп Юг Ше зедиепна!| паретещайоп. ш огдег ю а|оп Фе огаег оЁ арргохипаноп ш 
а| фе са|сшайпе рош оЁ фе ЫосК Фе ад @Нопа! Шепег-огдег депуайуе$ аге шио4исе пю 
Фе 4егепсе зсБетез. Пиегро!аноп ройупопиа!$ Неппне ул шире подез аге сопзбламе4 
ш Фе Юпи оЁтесштепсе те!анопз$ ог аге оМатед Бу 1аК ше Фе Шийто ргосез$ ое Гаотапое 
ап Ме\Моп ро]упопиа|5. Тре шёодисйоп оЁ Фе адФопа| депуайуез 4оез по{ шсгеазе фе 
иптепзтоп оЁ Фе зузет, зо Ше сотрщайопа| со3ё 1$ Фе зате аз ш Ше сазе оЁ зо[уше Бу Фе 
уасе соПосайоп тефо@$ ог Фет сотезропате пирйсй тефод5. Оп Фе Ъаз15 оРе ргорозе4 
а1еогИрил$ оЁ чер 517е сопёо| Фе {её ргоМетз \\еге ппретещеа, Ше питепса| зо[айоп оЁ 
УЛись ргоу14е$ Фе гедите4 ассигасу ул Ше тахиптит розз1Ые ицестаноп $Ер. 
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